import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
sns.set(color_codes=True)
sns.set_context("paper",font_scale=2)
sns.set_style("white")
%matplotlib inline
dados = pd.read_csv('aptos_receita2.csv')
Foi feita a análise dos candidatos de 18 a 29 anos do ano de 2020 com o objetivo de entender a distribuição do Fundo Eleitoral e uso do recurso por candidatura.
Para a análise foi utilizado dados de duas bases diferentes, uma na qual tinha o valor declarado de despesas máximas de campanha e outra com a descrição de receita dos 3 tipos de fundos.
Foi analisado 47.048 candidaturas, com 2.367 inaptas na situação de candidatura e 43.813 aptas da candidatura até as urnas. Tendo 242 com a situação em pleito inapta e 866 com situação inapta na urna
Para a análise foi considerado candidaturas aptas aquelas que desde a situação de candidatura até a urna estavam deferidas ou deferidas com recurso.
Os candidatos aptos tem em média 25 anos,com as mulheres sendo a maioria entre 18 e 20 anos e já os homens entre 21 e 29 anos. Há mais homens se candidatando que mulheres e 52% dos candidatos são negros. A maioria dos candidatos se encontram em Minas Gerais, seguido de São Paulo e Bahia. E o partido com o maior número de candidatos é MOVIMENTO DEMOCRÁTICO BRASILEIRO e o com menor número de candidatos é o PARTIDO DA CAUSA OPERÁRIA.
Dos 43813 candidatos considerados aptos há 777 que não declarou o valor de despesas máxima de campanha. Dentre esses 72% são homens e 54% declarados brancos. Esses candidatos se concentram em maoria em São Paulo seguido de Minas Gerais e o partido que mais tem candidatos que não declararam as despesas é o PARTIDO DOS TRABALHADORES.
Foi realizado a soma e média por candidato para todas as receitas declaradas pelo mesmo e nos diferentes tipos de fundo. Assim, foi feita a análise da soma total dos fundos por candidato. Dos 43.813 candidatos aptos apenas 34.213 declararam suas receitas, destes 773 não declarou receita e nem despesas e 4 declararam receita mas não declararam o valor de despesas de campanha.
| Descrição | Valores |
|---|---|
| count | 34.213 |
| mean | 11.204 |
| std | 1.122970 |
| min | 0 |
| 25% | 500 |
| 50% | 1.251 |
| 75% | 3.045 |
| max | 207.173700 |
| Idade | Médias |
|---|---|
| 18 | 3007 |
| 19 | 3083 |
| 20 | 2551 |
| 21 | 3898 |
| 22 | 3155 |
| 23 | 3571 |
| 24 | 73820 |
| 25 | 4381 |
| 26 | 4721 |
| 27 | 8899 |
| 28 | 5631 |
| 29 | 6382 |
Dos 34.213 candidatos que declararam receita, 33.816 tiveram o total de fundos declarados até 50.000 reais. 386 candidatos declaram receita entre 50.000 e 1 milhão, tendo em torno de 7 candidatos que declararam mais de 1 milhão e 1 candidata que declarou mais de 200 milhões. Com isso foi analisado os candidatos que tiveram declarados até 50.000 reais e considerando esses outros candidatos como outliers; sugerindo então a exclusão do fundo outros da soma total de fundos para tratar essas anomalias, porém fazendo uma análise apenas para esses.
Comportamento dos dados dos 3 tipos de fundo
Descrição | Partidario | Especial | Outros --------- | ------------ | --------- | ------ count | 34213 | 34213 | 34213 mean | 142 | 2697 | 8364 std | 4522 | 78839 | 1120108 min | 0 | 0 | 0 25% | 0 | 0 | 140 50% | 0 | 0 | 605 75% | 0 | 889 | 1700 max | 552079 | 9905320 | 207173700
fig = px.box(dados, y='soma_total')
fig.show()
TOTAL DE FUNDOS POR RAÇA
A sugestão da análise é considerar pretos e pardos como negro
fig = px.box(dados, x= 'DS_COR_RACA', y='soma_total')
fig.show()
fig = px.box(dados, x= 'DS_GENERO', y='soma_total')
fig.show()
fig = px.box(dados, x= 'SG_UF', y='soma_total')
fig.show()
fig = px.box(dados, x= 'NM_PARTIDO', y='soma_total')
fig.show()